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摘 要 心理 学 研究 中 ， 不 恰当 的 模型 参数 估计 框架 或 收敛 准则 严重 影响 模型 参数 点 估计 的 
可 靠 性 ， 进 而 影响 到 研究 结论 的 可 靠 性。 本 研究 
计 新 框架 ， 以 及 新 收敛 判断 方法 。 通 过 模拟 研究 与 实证 数据 分 析 的 方式 ， 探索 了 新 参数 估计 
框架 和 新 收敛 判断 方法 的 表现 , 并 与 已 有 模型 参数 估计 框架 及 收敛 判断 方法 进行 了 比较 。 结 
果 显 示 ， 新 的 模型 参数 估计 框架 及 收敛 准则 的 表现 优 于 已 有 的 模型 参数 估计 框架 及 收敛 准 
Б 则 ， 能 有 效 提高 模型 参数 点 估计 的 可 靠 性 。 


关键 词 参数 估计 ， 点 估计 ， 收 敛 准 则 ， 认 知 诊断 模型 


S 


提出 了 基于 MLE-EM 的 CDM 模型 参数 估 


自然 科学 及 社会 科学 各 个 领域 中 ， 研 究 结论 的 可 靠 性 (研究 结论 可 以 被 信赖 的 程度 )， 尤 
其 是 研究 结果 的 可 重复 性 (replicatiom) 受 到 极 大 关注 (参考 ， 胡 传 鹏 等 , 2016; Begley & Ellis, 
2012; Ioannidis, 2005, 2008; Tajika et al., 2015). Nature 杂志 对 此 进行 了 一 项 调查 ， 发 现 70% 
| 以 上 的 研究 者 无 法 重复 他 人 实验 , 50% 以 上 的 研究 者 无 法 重复 他 们 自己 的 实验 (Baker, 2016). 
c 心理 学 领域 中 , 研究 者 对 可 重复 性 问题 出 现 的 比例 、 可 能 的 原因 展开 了 探讨 ， 并 从 统计 方法 

和 研究 实践 两 方面 提出 了 解决 方案 (例如 ， 可 参考 《心理 学 报 》 的 投稿 指南 及 论文 自 检 报告 


或 American Psychological Association, 2020 等 )。 

心理 学 研究 中 ,研究 者 使 用 模型 参数 描述 被 试 的 外 显 行 为 (或 观察 数据 ) 与 其 潜在 特质 之 
间 的 关系 。 研究 者 在 使 用 心理 计量 模型 拟 合 数 据 时 , 倾向 于 将 计量 模型 及 参数 估计 软件 作为 
一 个 “黑箱 ”使 用 ,很 少 关注 模型 参数 估计 值 是 否 可 靠 。 举例 而 言 ， 极 大 似 然 法 是 当前 应 用 最 
广泛 的 模型 参数 估计 方法 之 一 , 极 大 似 然 法 中 仅 存 在 全 局 最 优 解 的 一 个 前 提 是 似 然 函 数 是 凸 
函数 。 然 而 ， 实 践 中 这 个 假设 有 可 能 不 成 立 ， 使 得 模型 参数 存在 两 个 及 以 上 的 局 部 最 优 解 。 
使 用 同一 个 模型 分 析 相 同 数 据 时 ， 不 同 初始 值 可 能 会 导致 模型 参数 收敛 于 不 同 的 局 部 最 优 
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解 。 根 据 极 大 似 然 法 原理 ， 似 然 函数 值 不 同 ， 说 明 产 生 了 不 同 的 模型 参数 估计 值 ; 似 然 函 数 


值 之 间 的 差异 越 大 ， 说 明 模 型 参数 局 部 最 优 解 之 间 的 差异 越 大 。 例 如 ， 假 设 /是 模型 中 任意 
一 个 参数 ， 如 果 第 一 次 的 点 估计 值 与 第 二 次 的 点 估计 值 的 差 7D 一 了 中 不 近似 为 0， 说 明 在 
这 两 次 估计 中 模型 参数 y 的 估计 值 及 95% СІ 不 同 。 


模型 参数 点 估计 的 可 靠 性 是 研究 结论 可 靠 性 的 基础 。 因此 , 如 何 提高 模型 参数 估计 值 的 


可 靠 性 ， 进 而 提高 研究 结果 的 可 重复 性 是 本 文 将 要 探讨 的 主要 问题 。 

认 知 诊断 (或 者 是 诊断 分 类 ) 使 用 心理 计量 模型 推断 被 试 可 观察 的 外 显 行为 与 其 潜在 的 
多 维 、 细 粒度 的 心理 特质 (如 心理 结构 、 技 能 、 加 工 过 程 或 策略 等 ， 统 称 为 属性 ) 之 间 的 关系 
(Rupp etal., 2010)。 认 知 诊断 模型 (cognitive diagnostic model, CDM) 在 心理 、 教 育 、 社 会 、 生 


物 以 及 其 他 多 个 领域 中 得 到 了 越 来 越 多 的 关注 (Sorrel et al., 2016; Wu et al., 2017)。 因 此 ， 本 


` 


XA CDM 为 例 ， 探 讨 模型 参数 点 


圳 计 的 可 靠 性 问题 。 


目前 ， 极 大 似 然 期 望 最 大 化 算法 (maximum likelihood estimation using the expectation 


maximization algorithm, MLE-EM) 是 应 用 最 广泛 的 CDM 模型 参数 估计 方法 之 一 (de la Torre, 


2009, 2011; von Davier, 2008). fl 


П, Е В iE zi Hf] CDM (George et al., 2016). GDINA (Ma 


& de la Torre, 2020) 软 件 包 以 及 flexMIRT, Latent GOLD, тайт. Mplus (Sen & Terz, 2020; 


Templin & Hoffman, 2013) $c fF! 


均 可 使 用 MLE-EM 估计 CDM 的 模型 参数 。 理 想 条 件 下 ， 


使 用 MLE-EM 方法 能 够 获得 具有 渐 近 性 、 一 致 性 等 优良 特性 的 点 估计 值 。 但 是 ， 研 究 者 指 


出 使 用 MLE-EM 算法 估计 CDM 模型 参数 时 ， 可 能 会 遇 到 的 问题 有 : 模型 参数 不 收敛 、 项 


目 参 数 极端 值 、( 较 差 的 ) 局 部 最 优 解 以 及 边界 值 等 (DeCarlo, 2011, 2019; Ma & Guo, 2019; Ma 


& Jiang, 2021; Philipp et al., 2018; Templin & Bradshaw, 2014; Zeng et al., 2022)。MLE-EM {fif 


计 的 一 般 过 程 是 ， 给 定 模型 参数 初 


ЯМА, АНТ E 步 (期 望 步 ) 和 M 步 (最 大 化 步 )， 满 足 特 


定 的 收敛 准则 (convergence criterion 或 termination criterion) 后 停止 迭代 ， 输 出 模型 参数 的 点 


估计 值 。 因 此 ， 可 以 从 参数 估计 框架 (包括 模型 参数 初始 值 设置 、EM 过 程 等 ) 及 收敛 准则 等 


方面 着 手 解决 模型 参数 点 估计 可 靠 性 问题 。 


本 文 将 在 第 2 НОК CDM 模型 参数 估计 中 模型 参数 估计 框架 及 收敛 准则 存在 的 问 
题 ， 以 及 这 两 个 问题 对 于 参数 估计 可 靠 性 的 影响 ; 在 第 3 部 分 详细 说 明 新 提出 的 模型 参数 估 
计 框 架 及 收敛 准则 ， 并 在 第 4 部 分 通过 模拟 研究 比较 新 方法 与 已 有 方法 在 模型 参数 估计 可 
靠 性 方面 的 表现 ; 第 5 部 分 是 实证 数据 分 析 , 目的 是 检验 新 提出 的 模型 参数 估计 框架 及 收敛 


准则 在 估计 CDM 模型 参数 时 的 表 


展望 。 


现 ， 并 与 GDINA 软件 包 的 表现 进行 比较 ; 最 后 是 讨论 与 


2 CDM 及 其 模型 参数 估计 中 存在 的 问题 

在 这 一 部 分 ， 将 首先 介绍 饱和 CDM 及 属性 层级 CDM(hierarchical cognitive diagnostic 
model, HCDM); 然后 以 此 为 基础 阐述 模型 参数 估计 中 存在 的 不 收 伊 、 项 目 参数 极端 值 、 
( 较 差 的 ) 局 部 最 优 解 以 及 边界 值 等 问题 。 
2.1 饱和 CDM 及 HCDM 


为 表达 便利 ， 设 在 一 个 认 知 诊断 测验 中 有 N 个 被 试 , 玉 个 属性 ，7 个 项 目 ， 且 属性 与 


项 目 均 为 0-1 计 分 。 令 矩阵 y = {ywj} “表示 被 试 在 测验 项 目 上 的 观察 作答 反应 ，ywj = 1 


表示 被 试 n ЛЕЕ А, уьу = OR ARIES. HMO = (qu] 表示 属性 与 测验 项 目 


的 对 应 关系 ，qjx = 1 表示 项 目 j 测量 了 属性 Kk，gqjx = 0 则 表示 没有 测量 。 和 矩阵 a = (au) 
表示 所 有 可 能 的 属性 掌握 模式 ，awm = 1 表示 具有 第 ! 种 属性 掌握 模式 的 被 试 掌握 了 属性 
К, ay = 0 表示 没有 掌握 , 工 表 示 所 有 可 能 的 属性 掌握 模式 的 数量 。 参 考 以 往 研究 的 表述 
( 田 伟 等 , 2014; Dempster et al., 1977)， 将 被 试 的 项 目 反 应 第 阵 y 称 为 不 完整 数据 
(“incomplete” data)， 将 项 目 反 应 矩阵 及 被 试 的 属性 掌握 模式 组 合 而 成 的 矩阵 称 为 完整 数据 
(complete”data)。 即 完整 数据 矩阵 x， 可 以 表示 为 ， 


X4 у: Q 
x = Xn = Yn An (1) 
Xy Ум Gy 


CDM 的 结构 模型 定义 了 被 试 总 体 中 所 有 可 能 的 属性 掌握 模式 a 的 分 布 比 例 。 令 nt = 
(Tr Ty 1) 1 表示 结构 参数 向 量 且 Ky = 1 一 人 ?x1，Xt1 表 示 第 1 种 属性 掌握 模式 mj = 
(Qik s Ч» … бук) 在 被 试 总 体 中 的 分 布 比例 ， 符 号 “T” 表 示 转 置 。 饱 和 CDM 的 结构 模型 
HHL = 2%, CDM 的 项 目 反应 模型 表示 的 是 具有 第 1 种 属性 掌握 模式 a 的 被 试 i 在 测验 项 目 


j 上 的 正确 作答 概率 。 饱 和 CDM 项 目 正确 作答 的 条 件 概率 可 以 表示 为 ， 


Ри; = P(Ynj = 1 | a,j) = Ajo + ХК Ао Чук + °° Aj Kok) Па каж О) 


公式 O) 中 qj = (q. jo o dje) 表示 项 目 / 在 Q 矩阵 中 所 对 应 的 向 量 ， 在 项 目 j РАЖ 


IBEW, Ауу ao FEAT LE К BE ЛУ, Ay ae ao DU Rz TS LT. THY 
目 参 数 向 量 和 及 结构 参数 向 量 tt 构 成 了 模型 参数 y = (АТ, nT)T. 
饱和 CDM 与 HCDM 的 区 别 在 于 结构 模型 和 项 目 反 应 模型 的 定义 不 同 ，HCDM BET 


饱和 CDM 中 。 为 详细 说 明 这 两 者 之 间 的 关系 ， 现 举例 说 明 。 假 设 一 个 测验 中 K = 2，qj = 


(LIT, ВАА n ВЕ Е А ча = (DT; 且 掌 握 第 一 个 属性 (ai) 是 掌握 第 二 个 属性 的 


前 提 (gs)。 那 么 ， 在 饱和 CDM 中 ， 所 有 可 能 的 属性 掌握 模式 可 以 表示 为 ， 


0 0 
_{% |_/1 0 

a= 9 (3) 
T 1 1 


即 饱 和 СОМ 的 结构 参数 可 以 表示 为 fr = (mi, 03,1- УЗ пот; 根据 公式 (2)， 本 例 中 的 
饱和 CDM 的 项 目 反 应 函数 可 以 表示 为 ， 


Paj = Ajo + Ал) + 41,00) + 421,2) (4) 
根据 属性 层级 关系 ，HCDM 中 所 有 人 允许 存在 的 属性 掌握 模式 是 ， 


of 0 0 
а = | ої -(: o) (5) 
T 1 1 


a 


即 HCDM 的 结构 参数 可 以 表示 为 tt = (mi,2,1 — п. — 2); HCDM 中 的 项 目 反 应 函数 可 
以 表示 为 ， 

Ри} = Ajo + Ajay + 472,012) (6) 
比较 表达 式 (3) 和 (5)， 及 表达 式 (4) 和 (6)， 可 以 发 现 将 饱和 СОМ 中 的 一 些 结构 参数 以 及 项 目 
参数 约束 为 0， 可 获得 HCDM。 也 就 是 ， 如 果 “ 真 ”模型 为 HCDM， 但 使 用 饱和 CDM 估计 
模型 参数 时 ， 部 分 模型 参数 的 真 值 等 于 0。 一 些 结构 模型 参数 真 值 等 于 0， 意味 着 这 些 参数 
在 参数 空间 的 下 界 ， 如 果 不 解决 这 种 这 类 边界 值 问题 可 能 会 造成 MLE-EM 参数 估计 存在 多 
种 问题 。 
2.2 CDM 模型 参数 估计 中 可 能 存在 的 问题 
使 用 CDM 拟 合 作答 反应 数据 时 ， 如 果 模 型 参数 过 多 、 样 本 量 较 小 ， 或 者 是 模型 参数 
中 存在 边界 值 尤其 是 结构 参数 中 存在 边界 值 等 问题 时 ， 可 能 导致 模型 参数 不 收敛 、 项 目 参 


数 存 在 极端 值 或 者 是 存在 多 个 局 部 最 优 解 等 问题 (Ma & Jiang, 2021; Templin & Bradshaw. 


H 
tT 


2014). 
CDM 的 项 目 正确 作答 概率 及 结构 参数 均 介 于 [0,1] 之 间 。 在 估计 模型 参数 时 可 能 会 遇 到 
项 目 参数 或 结构 参数 在 参数 空间 的 上 界 或 下 界 的 问题 ， 这 可 能 会 造成 模型 参数 无 法 估计 ， 
或 者 是 造成 模型 参数 的 标准 误 过 大 甚至 是 无 法 求解 。Ma 和 Jiang (2021) 提 出 贝 叶 斯 众 数 估 
计 及 单调 约束 ， 估 计 G-DINA 模型 的 项 目 参数 。 但 是 ， 他 们 的 研究 指出 贝 叶 斯 众 数 估计 或 
贝 叶 斯 众 数 与 单调 约束 结合 的 算法 估计 获得 的 项 目 参数 可 能 是 有 偏 的 ， 另 外 ， 他 们 也 指出 
在 实践 应 用 中 先 验 分 布 的 选择 需要 非常 谨慎 ， 因 为 不 恰当 的 先 验 信息 可 能 会 导致 误导 性 
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的 、 甚 至 是 错误 的 结果 。 为 将 模型 参数 估计 值 约束 在 适当 的 边界 中 ，Yamaguchi (2022) 
步 提出 将 结构 参数 也 要 加 以 约束 。 然 而 ， 当 属性 之 间 存 在 层级 关系 ， 但 是 使 用 饱和 结构 模 
型 估计 参数 时 ， 有 些 结构 参数 的 真 值 等 于 0， 以 不 恰当 的 先 验 约束 使 其 远离 0 的 做 法 是 不 
对 的 。 
使 用 MLE-EM 估计 CDM 模型 参数 时 需要 设 定 模型 参数 初始 值 yY'0)。 在 Yo 的 基础 上 ， 
E 步 求 完整 数据 似 然 函数 的 期 望 ，M 步 求 最 大 化 期 望 函数 的 模型 参数 。 每 一 次 迭代 ( 记 为 ， 
rep) 中 都 会 产生 一 个 模型 参数 估计 向 量 yYCe2)， 收 和 敛 判 断 方法 的 值 小 于 收敛 容 差 或 者 达到 最 
大 从 代 次 数 则 和 迭代 停止 (George et al., 2016; Ma & de la Torre, 2020)。 如 果 是 因为 收敛 判断 方 
法 的 值 小 于 收敛 容 差 而 停止 闪 代 ， 那 么 模型 参数 收敛 ， 并 且 将 最 后 一 次 迭代 中 的 参数 作为 
模型 参数 估计 值 $， 否 则 ， 没 有 收敛 。 

接 下 来 将 针对 CDM 模型 参数 估计 中 的 结构 参数 边界 值 、 最 大 人 迭代 次 数 以 及 初始 值 可 
能 对 M 步 造成 的 影响 及 迭代 次 数 展开 探讨 ， 阐 述 已 有 方法 存在 的 问题 。 有 具体 而 言 ，MLE- 
EM 的 卫 步 中 进行 的 是 : 给 定 观 察 数据 y 以 及 模型 参数 ywem) 条 件 下 ， 求 完整 数据 x 对 数 似 然 
函数 的 期 望 ， 


H 
tT 


Olvly: Y**?] = Е, уус (log [Па z Mas 227 0 — Р) ^J] (7) 


E 步 除了 获得 以 上 表达 式 外 ， 还 根据 观察 数据 y 以 及 模型 参数 ywem 计 算出 第 rep RP 


所 有 属性 掌握 模式 的 期 望 次 数 nf 2) 以 及 每 种 属性 掌握 模式 下 正确 作答 项 目 7 的 期 望 人 数 


rU, M 步 进行 的 是 ， 求 最 大 化 函数 Q [yly;YCeo)] 的 模型 参数 Yoep+D。 然 后 用 YCep+D 蔡 


换 巨 步 中 的 模型 参数 y0eP)， 并 依次 迭代 。 直 到 满足 收敛 条 件 ， 或 者 达到 了 预先 设 定 的 最 大 
迭代 次 数 而 停止。 
以 饱和 G-DINA 模型 的 参数 估计 为 例 ， 在 M 步 中 ， 经 过 公式 推导 (参考 , de la Torre, 


2009, 2011) 可 以 求 得 更 新 后 的 第 1 种 属性 掌握 模式 下 项 目 j 正确 作答 概率 的 表达 式 ， 


(rep) 
A m (8) 


m "a 


根据 By?* 可 以 容易 地 获得 CDM Ж t i HAT ITO. og e HUE ИМЕ 
可 以 表示 为 
co = ы (9) 
CDM 研究 中 至 少 有 两 种 情形 的 存在 会 使 得 结构 参数 出 现 边界 问题 (DeCarlo, 2011, 2019; 


性 之 间 存 在 层级 关系 ， 但 使 用 


e 


Templin & Bradshaw, 2014; Yamaguchi, 2022)。 第 一 种 情形 是 属 
5 
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饱和 模型 估计 。 对 比 饱 和 CDM 及 HCDM 可 以 发 现 ， 如 果 “ 真 ”模型 是 HCDM， 但 是 用 饱和 
CDM 拟 合 数据 的 时 候 ， 模 型 中 的 一 些 结构 参数 是 “不 允许 存在 ”的 参数 ， 即 这 些 参数 的 真 值 
为 0。 第 二 种 情形 是 样本 量 较 少 时 可 能 使 得 某 些 属 性 掌握 模式 所 对 应 的 被 试 量 较 少 或 是 等 于 
0。 以 上 两 种 情形 中 ， 结 构 参数 x 的 真 值 等 于 0， 由 于 nj =N xm, n 8648 M 步 中 出 现 属 


Е 


掌握 模式 的 期 望 数 nf PRF 0 的 问题 。 即 公式 (8) 中 分 子 、 分 母 有 可 能 等 于 0， 造 成 迭代 异 


常 终止 。 结 构 参数 边界 值 问 题 与 模型 收敛 判断 以 及 СОМ 的 参数 估计 的 可 靠 性 紧密 关联 。 

对 于 边界 值 可 能 引起 的 问题 , 目前 至 少 有 三 种 解决 方法 。 第 一 种 是 使 用 先 验 分 布 对 正确 
作答 概率 加 以 约束 (Liu et al., 2016; Ма & Jiang, 2021)。 这 种 方法 在 使 用 时 需要 非常 谨慎 ， 
为 它 会 导致 有 偏 的 参数 估计 值 , 尤其 是 在 属性 之 间 存 在 层级 关系 的 情境 中 。 第 二 种 是 GDINA 
软件 包 中 默认 采用 的 方法 (Ma & de la Torre, 2022)。 具 体 做 法 是 : 如 果 公 式 (8) 的 分 母 小 于 0.001, 


那么 在 分 子 、 分 母 上 分 别 加 校正 系数 0.0005, 0.001, MARP? = 0.0005/0.001 = 0.5. 


然而 ， 这 一 设置 是 否 合理 有 待 商 检 。 第 三 种 是 CDM 软件 包 中 采用 的 方法 ， 每 次 迭代 中 均 在 


公式 (8) 的 分 母 ne 加 上 一 个 非常 小 的 值 10-10 (Robitzsch etal.,2022)。 但 是 ， 这 种 设置 在 一 


些 特殊 情况 下 (如 ， 分 子 、 分 母 的 值 均 接近 10-5 时 ) 是 否 合理 同样 有 待 商检 。 


全 局 最 优 解 


. (rep) 
o[vly; v**"] 局 部 最 优 解 


局 部 最 优 解 


yere 


= 


单个 参数 的 局 部 最 优 解 或 全 局 最 优 解 的 简单 示例 


MLE-EM 在 迭代 进行 前 需要 设置 模型 参数 初始 值 。 CDM 模型 参数 估计 中 参数 初始 值 向 
量 Y(o) 的 设置 可 能 会 对 MLE-EM 的 表现 造成 影响 。 估 计 模 型 参数 时 ，MLE-EM 以 参数 初始 
值 Yo 为 起 始点 通过 迭代 逐渐 收敛 到 (局 部 ) 最 优 的 模型 参数 估计 。 理 想 情 况 下 ， 函 数 表达 式 
(7) 中 仅 存 在 全 局 最 优 解 , 初始 值 y 避 不 会 对 最 终 的 模型 参数 估计 值 Y 产 生 影响 。 然 而 , 当 CDM 
的 似 然 函 数 存在 多 个 局 部 最 优 解 时 ,初始 值 y%) 不 同 ， 最终 估 计 获 得 的 也 会 不 一 样 。 即 ， 当 
模型 满足 特定 收敛 准则 时 ， 模 型 参数 估计 值 ? 可 能 仅 是 一 个 较 差 的 局 部 最 优 解 (Ma & Guo, 
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2019; Zeng et al., 2022)。 为 提高 CDM 模型 参数 估计 值 的 可 靠 性 ， 研 究 者 提出 使 用 多 个 初始 
值 (例如 ，300) 估 计 模 型 参数 (Ma & Guo,2019); 或 者 是 生成 多 个 初始 值 (例如 ，200) 并 计算 其 
似 然 函数 值 ， 然 后 选择 似 然 函数 值 最 大 的 那 组 模型 参数 作为 MLE-EM 迭代 的 初始 值 。 图 1 
中 呈现 了 单个 参数 的 局 部 最 优 解 与 全 局 最 优 解 的 简单 示例 。 在 这 个 例子 中 ,有 两 个 点 是 局 部 
最 优 解 ， 一 个 全 局 最 优 解 。 假 设 y 中 是 CDM 模型 中 的 任意 一 个 参数 的 初始 值 ， 如 果 y 名 在 А 
点 ， 那 么 最 终 收敛 于 图 中 左 侧 的 局 部 最 优 解 ， 如 果 y' 中 在 C 点 ， 那 么 最 终 收 敛 于 图 中 右 侧 的 
局 部 最 优 解 ， 如 果 y 疏 在 В 点 ， 那 么 最 终 收 化 于 全 局 最 优 解 ， 在 这 三 个 解 中 ， 初 始 值 取 А 点 

时 的 解 是 最 差 的 。 需 要 特别 说 明 的 是 ，CDM 参数 估计 过 程 远 比 图 1 中 呈现 的 过 程 复杂 ， 单 

一 的 初始 值 难 以 保证 获得 较 好 的 模型 参数 估计 。 

2.3 CDM 模型 参数 估计 的 收敛 准则 
> 收敛 准则 用 于 判断 模型 参数 估计 值 是 否 已 经 足够 接近 模型 参数 最 优 解 。 一 般 而 言 , 收敛 
准则 由 收敛 判断 方法 、 收 敛 容 差 及 最 大 迭代 次 数 这 三 部 分 组 成 (Paek & Cai, 2013). WBA AE 
是 研究 者 在 模型 参数 估计 前 预先 设 定 的 、 用 于 判断 模型 是 否 收敛 的 一 个 较 小 的 值 (例如 , 10-3 
或 10-56， 甚 至 更 小 )。 模 型 参数 估计 中 ， 如 果实 际 迁 代 次 数 没 有 达到 预先 设 定 的 最 大 人 迭代 次 
数 ,收银 判断 方法 在 迁 代 前 与 迭代 后 的 差异 小 于 收 和 敛 容 差 ， 说 明 模 型 参数 估计 值 收敛 ; 如 果 
实际 迭代 次 数 达 到 了 最 大 和 欠 代 次 数 , 但 是 收敛 判断 方法 在 迭代 前 与 迭代 后 的 差异 没有 小 于 收 
敛 容 差 ， 说 明 模 型 参数 估计 值 没有 收敛 ， 无 法 获得 模型 的 极 大 似 然 估计 值 。 
x 当前 , 可 以 用 于 判断 CDM 模型 参数 估计 是 否 收敛 的 方法 至 少 有 六 种 (George et al., 2016; 


Ma & de la Torre, 2020; Ma & de la Torre, 2022; Robitzsch et al., 2022; Rupp & van Rijn, 2018). 

T ПОРН SRE. БРУК JE BD) JH Н SB A 
A ren) 与 迭代 前 的 项 目 参数 向 量 值 Xoen) 的 差 的 绝对 值 中 的 最 大 值 maxfabs[Acep+D — 
XGep)]}， 小 于 预先 设 定 的 收敛 容 差 , 则 认为 模型 参数 收 伍 且 停止 逻 代 。 这 种 收敛 判断 方法 的 
优势 在 于 ， 它 所 使 用 的 收敛 容 差 就 是 项 目 参数 的 精度 。 

第 二 种 是 模型 参数 差 的 绝对 值 。 这 种 方法 与 项 目 参数 绝对 值 差 类 似 ; 不 同 之 处 在 于 模型 

参数 差 的 绝对 值 将 结构 参数 的 差 也 纳入 到 收敛 判断 中 , 即 maxfabs[ycep+D — YCep)]} 中 的 最 

大 值 仍 小 于 收敛 容 差 时 ， 认 为 模型 参数 收敛 。 

第 三 种 是 项 目 正确 作答 概率 差 的 绝对 值 . 这 种 方法 比较 的 是 迁 代 前 后 所 有 项 目 在 所 有 属 

性 掌握 模式 条 件 下 的 正确 作答 概率 的 绝对 值 的 差 中 的 最 大 值 maxfabs[PCep+D — pere] 


` De 2 L 
和 否 小 于 某 个 预先 设 定 的 收敛 容 差 ， 其 中 P e (Py). 
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第 四 种 是 项 目 正确 作答 概率 和 结构 参数 组 成 的 向 量 的 差 的 绝对 值 . 这 种 方法 以 第 三 种 方 
法 为 基础 ， 将 结构 参数 也 纳入 考虑 ， 因 此 不 再 袭 述 。 可 以 发 现 ， 以 上 四 种 收敛 判断 方法 是 基 
于 全 部 或 部 分 模型 参数 的 。CDM 中 项 目 正确 作答 概率 一 般 是 由 项 目 参 数组 合 而 成 ， 也 就 是 
说 相对 于 项 目 参 数 而 言 ， 项 目 正确 作答 概率 差 这 种 方法 更 容易 满足 模型 收敛 准则 。 
第 五 种 是 对 数 似 然 函 数 差 。 对 数 似 然 函数 差 计 算 的 是 观察 数据 的 第 rep 次 及 与 第 rep 
次 迭代 的 负 2 倍 对 数 似 然 函 数 的 差 的 绝对 值 abs{-2[2(yCep |у) – e(y €? |y)]]. 这 个 方法 
认为 迭代 前 后 的 对 数 似 然 函 数值 的 差 小 于 收敛 容 差 时 , 似 然 函 数 取 得 了 最 大 值 。 然 而 ， 有 研 
究 者 指出 这 种 方法 的 不 足 之 处 在 于 对 数 似 然 函 数值 的 大 小 受到 项 目 数量 及 被 试 量 的 影响 ， 
此 建议 使 用 相对 似 然 差 。 
第 六 种 是 相对 似 然 差 。 相 对 似 然 差 方法 将 对 数 似 然 函 数 的 值 也 纳入 到 收敛 判断 方法 的 计 
> 算 中 。 它 试图 消除 对 数 似 然 函数 值 的 大 小 对 于 收敛 准则 的 影响 。 这 种 方法 比较 的 是 迭代 前 后 
两 个 似 然 函数 的 差 与 当前 似 然 函 数 的 比 的 绝对 值 是 否 小 于 预先 设 定 的 收敛 容 差 。 GDINA šX 
件 包 中 使 用 的 是 abs{2 [#(үТ°Р+®|у) — e(y&*?|y)]/e(yte*? |y)} (Ma etal., 2022)。 这 个 方 
法 的 不 足 之 处 在 于 模型 参数 估计 前 ?(Y?ly) 是 未 知 的 ， 因此 如 何 根据 这 个 未 知 值 而 去 预先 设置 
恰当 的 收容 差 是 这 个 方法 存在 的 问题 。 
CDM 模型 参数 估计 中 ， 研 究 者 使 用 的 收敛 判断 方法 、 收 敛 容 差 及 最 大 和 迭代 次 数 上 有 明 
显 差 异 。 研究 者 经 常 使 用 的 收敛 判断 方法 是 项 目 参 数 差 的 绝对 值 , 且 对 应 的 收敛 容 差 为 103 
又 或 10-4 (参考 ，de la Torre 2009, 2011; Ma & de la Torre, 2016; Paulsen & Valdivia, 2022; Sen & 
Terzi, 2020)。 一些 研究 者 在 使 用 项 目 参 数 差 的 绝对 值 时 ， 将 收敛 容 差 设置 的 更 小 ,例如 1075 
or (George et al., 2016). 10-6 (Rupp & van Rijn, 2018)2%1077(Chiu et al, 2022); 也 有 一 些 研 究 
者 使 用 对 数 似 然 函数 差 进行 收敛 判断 ， 并 将 收敛 容 差 设置 为 10-? 或 10-3 (Khorramdel et al., 
2019; Ma & Guo,2019)。 但 是 Rupp 和 van Rijn (2018) 认 为 对 数 似 然 函 数 差 依赖 于 项 目 数 量 及 
被 试 量 , 在 进行 模型 参数 收敛 判断 时 相对 似 然 差 可 能 会 更 好 。 但 是 他 们 并 没有 对 相对 似 然 差 
的 表现 ， 以 及 这 种 方法 适用 的 收敛 容 差 进行 研究 。 
另外 , 研究 者 在 估计 模型 参数 时 大 多 倾向 于 使 用 软件 的 默认 设置 , 较 少 对 默认 选项 进行 
修改 ， 但 是 CDM 模型 参数 估计 软件 的 默认 设置 也 有 较 大 区 别 。 举 例 而 言 ，GDIN4 及 CDM 
软件 包 中 默认 使 用 的 收敛 准则 有 明显 区 别 (Ma et al., 2022; Robitzsch et al., 2022). GDINA 软 
件 包 中 默认 使 用 的 收敛 判断 方法 、 WAS FE МБ ЖАТКА УЛДЕ: 项 目 正确 作答 概率 和 结 
构 参数 组 成 的 向 量 的 差 的 绝对 值 、10-4 及 2000. CDM 软件 包 中 使 用 的 是 收敛 方法 的 组 合 ， 
并 且 不 同 函数 使 用 的 默认 设置 不 同 ,.CDM id gdina 函数 中 默认 使 用 的 是 收敛 准则 是 : 


收敛 容 差 为 10 7^ Н 202 2А 270 w ak 257310 АХИ РА СЕ 73 TE 2. 


в, H 


Ig KISS 1000. 


可 以 发 现 , 研究 者 使 用 的 收敛 准则 有 很 大 差别 。 因 此， 相同 计量 模型 条 件 下 ,不 同 的 收 


敛 准则 
参数 估 


是 否 会 对 模型 参数 点 估计 的 可 靠 性 产生 影响 ; in АЕ 1 


H, 在 目前 所 有 可 用 的 模型 


计 收 敛 判 断 方法 中 , 哪 种 效果 是 最 好 的 ; 或 者 是 能 否 开发 一 种 具有 广泛 适用 性 的 方法 


提高 CDM 模型 参数 点 估计 的 可 靠 性 是 一 个 需要 解决 的 重要 问题 。 


3 新 的 模型 参数 估计 框架 及 收敛 准则 


如 前 所 述 CDM 模型 参数 估计 中 的 边界 值 、 局 部 最 优 解 、 项 目 参数 极端 值 、 模 型 参数 不 


收敛 ,以 及 收敛 准则 


参数 估 


的 问题 


设置 等 可 能 会 对 模型 参数 点 估计 的 可 靠 性 产生 影响 , 进而 可 能 会 影响 到 


研究 结果 的 可 重复 性 。 因 此 ， 本 文 提出 新 的 模型 参数 估计 框架 试图 解决 2.2 部 分 提 及 的 模型 


计 中 可 能 存在 的 问题 ; 提出 新 的 收敛 准则 试图 解决 2.3 部 分 提 及 的 收敛 准则 可 能 存在 


° 


首先 ， 阐 述 边界 值 问题 的 解决 方法 。 通 过 2.2 部 分 可 以 发 现 ， 当 前 关于 边界 值 的 三 种 解 
都 存在 一 些 可 能 的 不 足 。 借 鉴 GDINA 及 CDM 软件 包 中 的 设置 ， 本 文 使 用 的 是 : 如 


决 方法 


果 公 式 


ЛА ABA PBA FIR M 


尽量 减 


(8) 的 分 母 小 于 10-1 时 ,在 分 母 上 加 上 10-*。 第 1 种 属性 掌握 模式 下 ， 正 确 作答 项 目 
FE 掌握 模式 下 的 期 望 人 数 ( 分 母 )， 


所 以 使 用 这 个 方法 可 以 保 


证 公式 (8) 中 BY*?+D 的 最 大 值 不 会 超过 0.01。 即 ， 这 个 方法 在 保证 分 母 不 等 于 0 的 前 提 下 ， 


小 校正 系数 对 正确 作答 概率 的 影响 。 感 兴趣 的 读者 可 以 尝试 使 用 其 他 值 , 但 是 我 们 认 


型 参数 


其 


模 


估计 结果 不 会 产生 明显 影响 。 


为 只 要 满足 分 母 不 等 于 0， 且 术 п, DF 0.01) 这 两 个 条 件 ， 不 同 的 校正 系数 对 模 


次 ,阐述 局 部 最 优 解 、 项 目 参数 极端 值 、 模 型 参数 不 收敛 等 问题 的 综合 解决 方法 。 


型 参数 收敛 判断 中 , 设置 最 大 迭代 次 数 的 唯一 目的 是 避免 模型 参数 估计 程序 陷入 到 无 


限 (或 近乎 于 无 限 ) 循 环 。 然而， 在 模型 参数 本 应 收敛 的 情况 下 ， 妇 


过 小 ， 
т" 


要 一 步 


可 能 会 使 得 MLE-EM 过 早 结束 循环 ， 造 成 不 收敛 的 错误 结果 。 解 决 不 收敛 问题 的 首 
是 设置 足够 大 的 收敛 次 数 ， 因 此 本 研究 中 将 最 大 收敛 次 数 设 置 为 50000。 


[ 果 将 最 大 收敛 次 数 设 置 的 


CDM 的 模型 参数 仅 存 在 全 局 最 优 解 的 一 个 前 提 是 公式 (7) 为 是 函数 。 但是， 这 个 前 提 有 


成 立 ， 导 致 模型 参数 可 靠 性 变 差 。 因 此 ， 参 考 Ma 和 Guo (2019) 的 相关 研究 ， 本 文 提 


时 未 必 
出 使 
初始 值 


多 个 初始 值 计 算 CDM 模型 参数 。 即 ， 遇 到 不 收敛 或 项 目 参数 存在 极端 值 时 重新 生成 
计算 如 果 新 初始 值 条 件 下 的 模型 参数 收敛 、 对 数 似 然 函 数值 大 于 先前 的 值 、 且 项 
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目 参数 不 存在 极端 值 时 ， 使 用 新 的 估计 值 作为 最 终 的 模型 参数 估计 值 。 在 接 下 来 的 部 分 将 这 
个 新 的 模型 参数 估计 框架 称 为 mCDM, 并 以 此 为 基础 探讨 各 种 收敛 准则 的 表现 。 由 于 mCDM 
在 特定 条 件 下 ， 需 要 对 于 同一 观察 数据 矩阵 JY， 在 多 个 不 同 初始 值 下 进行 模型 参数 估计 ， 运 
量 可 能 会 比较 大 。 因 此 参考 以 往 研 究 ( 刘 彦 楼 , 2022), mCDM 程序 计算 量 大 的 部 分 采用 C++ 
语言 及 并 行 计算 进行 。 特别 说 明 的 是 , mCDM 程序 已 上 传 到 科学 数据 银行 , 感 兴趣 的 读者 可 
以 自行 下 载 使 用 。 

最 后 ， 阐 述 本 文中 新 提出 的 收敛 判断 方法 。 

极 大 似 然 法 估计 的 原理 是 找到 最 大 化 观察 数据 对 数 似 然 函 数 的 模型 参数 值 , 并 将 其 作为 
模型 参数 “ 真 值 ”的 估计 。 收敛 判断 方法 的 用 途 是 判断 观察 数据 对 数 似 然 函数 的 值 是 否 已 经 近 
似 达 到 了 最 大 。 但 是 , 单一 的 判断 方法 在 特定 条 件 下 可 能 存在 缺陷 。 以 对 数 似 然 函数 差 及 模 
型 参数 差 的 绝对 值 为 例 进行 说 明 。 对 数 似 然 函 数 差 方 法 假定 第 rep 次 及 与 第 rep+1 次 迭代 的 
对 数 似 然 函数 的 差 小 于 预 设 的 收敛 容 差 时 ， 似 然 函 数值 达到 了 最 大 。 图 2 中 呈现 了 对 数 似 然 
函数 差 收 敛 判断 方法 可 能 存在 的 缺陷 的 简单 示例 。 假定 B 点 为 CDM 中 任意 一 个 参数 的 初始 
f&y(O 。 当 模型 参数 yep) 接 近 全 局 最 优 解 时 ， 如 果 似 然 函 数 的 曲线 比较 平坦 (可 参考 Farrell 
& Lewandowsky, 2018)， 那 么 将 会 出 现 模型 参数 差 的 绝对 值 变 化 较 大 ， 但 是 对 数 似 然 函 数 差 
变化 非常 小 的 问题 。 即 ， 模 型 参数 差 的 绝对 值 的 判断 效果 优 于 对 数 似 然 函数 差 。 模 型 参数 差 
的 绝对 值 可 能 存在 的 问题 在 于 , 似 然 函数 值 的 大 小 除了 受到 模型 参数 值 的 影响 之 外 , 还 受到 


项 目 数量 及 被 试 数量 的 影响 (可 参考 Rupp & van Rijn, 2018). 


全 局 最 优 解 


о[у; ye] 


yep) 


2 对 数 似 然 函数 差 收 敛 判 断 方法 可 能 缺陷 的 简单 示例 

理论 而 言 ， 进 行 CDM 模型 参数 估计 时 ,模型 参数 估计 收敛 判断 方法 及 收敛 容 差 设置 越 
严格 (这 也 就 意味 着 在 相同 收敛 容 差 条 件 下 ， 磷 代 次 数 更 多 )， 就 越 能 获得 使 得 2(?|y) 最 大 化 
的 模型 参数 估计 值 。 然 而 ， 实 践 中 由 于 样本 量 、 项 目 数量 、 属 性 数量 、 项 目 反 应 模型 、 属 性 
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层级 关系 及 О 矩阵 元 素 可 能 存在 错误 设 定 等 因素 的 存在 ， 很 难 预 先 判断 哪 种 方法 及 相应 的 


收敛 容 差 是 最 严格 的 。 因 此 ， 参 考 以 往 研 究 (George et al., 2016; Ma & de la Torre, 2020; Ma et 


al., 2022; Robitzsch et al., 2022; Rupp & van Rijn, 2018; von Davier 2008; Xu & von Davier, 2008), 
为 克服 单一 判断 方法 可 能 存在 的 缺陷 , 本 文 提 出 在 给 定 收敛 容 差 的 基础 上 综合 使 用 模型 参数 
差 的 绝对 值 、 项 目 正确 作答 概率 和 结构 参数 组 成 的 向 量 的 差 的 绝对 值 、 对 数 似 然 函 数 差 以 及 
相对 似 然 差 进行 模型 参数 收敛 判断 ， 并 将 其 称 为 综合 判断 法 。 

需要 说 明 的 是 ， 相 对 于 项 目 参数 (或 项 目 正确 作答 概率 ) 而 言 ， 结 构 参数 的 数量 相对 较 
少 。 被 试 观察 作答 反应 数据 可 以 为 每 个 结构 参数 提供 更 多 的 信息 , 其 估计 值 能 够 较 快 地 固定 
下 来 。 即 ， 理 论 上 收敛 判断 方法 中 是 否 包 含 结构 参数 应 该 没有 明显 差别 。 但 是 审慎 起 见 ， 在 
接 下 来 的 研究 中 采用 包含 结构 参数 的 方法 。 另外 ,与 GDINA 包 不 同 ， 本 研究 中 mCDM 程序 
使 用 的 相对 似 然 差 的 计算 公式 是 abs{[&(ywep+b|y) — #(yG°p)|y)|/e(yGep+D|y)), 

综 上 所 述 ， 本 研究 提出 了 基于 MLE-EM 的 CDM 模型 参数 估计 新 框架 及 新 收敛 准则 ， 
以 提高 模型 参数 点 估计 的 可 靠 性 。 新 的 模型 参数 估计 框架 包括 对 MLE-EM 方法 中 的 EE 步 及 
M 步 的 改进 。 对 卫 步 的 主要 改进 是 ， 必 要 时 (如 ， 模 型 参数 不 收敛 或 项 目 参数 存在 极端 值 时 ) 
使 用 不 同 的 初始 值 分 别 重新 计算 E 步 中 的 期 望 次 数 及 进行 后 续 的 迭代 。 对 M 步 的 主要 改进 


= 


是 ， 保证 公式 (8) 中 分 母 不 等 于 0 pie ) 较 小 。 


4 模拟 研究 
4.1 研究 目的 

本 研究 重点 关注 的 问题 是 : 新 提出 的 模型 参数 估计 框架 及 收敛 准则 能 否 有 效 提高 模型 参 
数 点 估计 值 的 可 靠 性 。 即 ， 新 提出 的 mCDM 框架 下 的 综合 判断 方法 是 否 优 于 现 有 框架 下 的 
方法 ， 能 否 在 尽量 保证 参数 在 合理 范围 内 的 前 提 下 ， 获 得 使 得 似 然 函数 最 大 的 参数 估计 值 。 
具体 包括 : (1) 数 据 生 成 模型 与 拟 合 模 型 均 为 饱和 G-DINA 时 ， 即 模型 完全 正确 设 定 条 件 下 
各 种 收敛 准则 的 表现 ，(2) 数 据 生成 模型 为 HCDM 但 使 用 饱和 G-DINA 拟 合 时 ， 即 模型 中 存 
在 边界 值 时 各 收敛 准则 的 表现 。 
4.2 研究 方法 

模型 参数 收敛 准则 的 表现 依赖 于 具体 的 模型 参数 估计 方法 ， 除 本 文中 新 开发 的 mCDM 
程序 外 ，CDM (version 8.2-6; Robitzsch et al., 2022)、GDINA (version 2.9.3; Ma et al., 2022) 这 
两 个 开源 软件 包 也 可 用 于 模型 参数 估计 。 AT, CDM 包 默 认 的 设置 是 ， 当 K > 4 时 使 用 属性 


掌握 模式 简化 方法 估计 结构 参数 (Xu & von Davier, 2008)。 本 文 预 研究 发 现 这 个 方法 下 获得 
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的 一 些 结构 参数 估计 值 是 有 偏 的 。 因 此 , 本 研究 使 用 的 模型 参数 估计 框架 有 两 种 : GDINA 及 
mCDM 程序 。 收 敛 判 断 方法 有 5 种 :模型 参数 差 的 绝对 值 、 项 目 正确 作答 概率 和 结构 参数 
组 成 的 向 量 的 差 的 绝对 值 、 对 数 似 然 函 数 差 、 相 对 似 然 差 以 及 综合 判断 法 。 并 将 这 5 种 收敛 
AWAD FNAL: dp. їр, 1, rl 及 comp。 参 考 先前 研究 ， 本 文中 考虑 了 3 种 收敛 容 差 : 
10-4、10-6、1073, 为 区 分 不 同 的 收敛 准则 , 将 GDINA 框架 下 的 收敛 方法 简称 前 加 字母 “G”、 
mCDM 框架 下 的 方法 加 字母 “m”, 并 将 3 种 收敛 容 差 的 小 数位 数 加 在 收敛 方法 简称 后 。 例 如 ， 
将 GDINA 框架 下 判断 方法 为 模型 参数 差 的 绝对 值 及 收敛 容 差 为 10-4 的 收敛 准则 ， 简 记 为 
Gdp4; 将 mCDM 框架 下 判断 方法 为 综合 判断 方法 及 收敛 容 差 为 10- 的 收敛 准则 ， 简 记 为 
mcomp6。 即 ， 本 文 探 讨 2 种 计算 框架 、5 种 收敛 判断 法 、3 种 收敛 容 差 所 组 成 的 30 种 收敛 
准则 在 可 能 影响 因素 中 的 表现 。 
> 模拟 研究 中 考虑 了 2 种 数据 生成 模型 : 饱和 G-DINA 模型 以 及 属性 (ci a>, @3)Z la] 5: 
线性 层级 关系 的 HCDM。 鉴 于 实践 中 难以 在 CDM 的 模型 参数 之 前 预先 设 定 恰当 的 层级 关 
Ж, 因此 ,选择 饱和 G-DINA 作为 拟 合 模型 。 样 本 量 及 项 目 数量 对 模型 参数 估计 准确 性 有 
要 影响 , 因此 对 于 收敛 准则 的 表现 也 可 能 会 产生 影响 ,本 研究 中 考虑 了 3 种 样本 量 : N= 500. 
1000 及 4000; 有 2 个 水 平 的 项 目 数量 : J = 16. 32; 且 将 属性 数量 固定 为 4。 为 保证 CDM 


的 模型 参数 具有 可 识别 性 (Gu & Xu 2019, 2020), WA AEH 16 时 本 研究 使 用 图 3 中 呈现 的 


[Hm 


地 


Q 矩阵 ;将 图 3 中 的 Q 矩阵 重复 两 次 ， 构 建 项 目 数量 为 32 时 的 О Ж. 
2 E E | E 值 
#3- E ШИ | 
ещ E 2- = | | | | | шо 
= 1- | | | 
А аы 1234567 8 9 1011 121314 1516 
Q 项 目 


图 3 模拟 研究 中 J= 16 BJ Q 矩阵 


为 更 好 地 贴近 CDM 应 用 情景 ,参考 Liu (2018) 及 Liu 等 人 (2022) 的 研究 设计 ， 使 用 以 下 
步骤 生成 项 目 参 数 及 结构 参数 真 值 : (1) 项 目 参数 中 截 距 项 ( 即 猜测 参数 )P(0) 随 机 取 自 [0.05， 
0.4] 的 均匀 分 布 ; 正确 作答 概率 参数 P(1) 随 机 取 自 [0.6, 0.95]; 并 且 将 主 效应 项 及 交互 效应 项 
设置 为 相等 , 即 主 效应 及 交互 效应 的 参数 值 都 等 于 [P(1) — P(0)] 除 以 它们 的 个 数 。(2) 结 构 参 
数 的 真 值 根据 多 维 正 态 分 布 生 成 , 具体 步骤 是 : 首先 , 将 多 维 正 态 分 布 的 均值 向 量 设 置 为 0， 
方差 一 协 方差 矩阵 的 非 对 角 线 元 素 的 值 从 均匀 分 布 [0.3, 0.7] 中 随机 抽取 。 然 后 ， 从 多 维 正 态 
分 布 中 随机 一 百 万 被 试 ， 并 以 0 为 切 点 对 每 个 被 试 的 取 值 向 量 进行 二 分 化 处 理 ， 即 ， 向 量 
的 值 大 于 0 设置 为 1， 其 他 情况 设置 为 0， 以 此 转化 为 属性 掌握 模式 。 最 后 ， 当 数据 生成 模 
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型 为 饱和 G-DINA 时 ， 直 接 计算 这 一 百 万 个 被 试 的 属性 掌握 模式 在 L 种 属性 掌握 模式 上 的 
分 布 比例 ， 并 将 其 作为 结构 参数 的 真 值 ， 当 数据 生成 模型 为 HCDM 时 ， 只 计算 这 一 百 万 个 
被 试 的 属性 掌握 模式 中 人 允许 存在 的 属性 掌握 模式 的 比例 ， 并 将 其 作为 HCDM 中 结构 参数 的 
真 值 。 每 种 实验 条 件 组 合 重复 500 次 以 获得 稳定 的 模拟 结果 , 且 将 mCDM 及 GDINA 的 最 大 
ENR KBAR WEN 50000. 

4.3 评价 指标 

收敛 准则 的 目的 是 判断 迭代 过 程 中 的 模型 参数 是 否 已 经 最 大 化 了 似 然 函 数 , 因此 本 研究 
的 评价 指标 主要 围绕 对 数 似 然 函数 进行 构建 ， 包 括 : 最 佳 似 然 函 数 次 数 (LLeesD， 似 然 函数 
的 均值 (LLmean)、 似 然 函数 的 最 大 值 (LLmax)、 似 然 函数 的 最 小 值 (LLmin) 以 及 似 然 函 数 的 标准 
差 (LLsq)。 最 佳 似 然 函 数 次 数 指 的 是 30 种 收敛 准则 在 500 次 重复 中 分 别 取 得 最 佳 似 然 函数 
值 的 次 数 LLpest = L I(LLcony в = LLmax r); 9 сопу Rk 表示 各 收敛 准则 在 第 R 次 重 
复 中 对 应 的 对 数 似 然 函数 值 ，LLmax к = max(LLeonv в) R 次 重复 中 所 有 收敛 准则 对 
应 的 对 数 似 然 函数 的 最 大 值 , 1 是 示 性 函数 用 于 判断 前 后 两 个 函数 值 是 否 相 等 ， 如 果 LLceony в 
与 LLmax R 相 等 ， 函 数 1 的 值 等 于 1， 和 否则 等 于 0。 关 于 LLsest 需 要 特别 说 明 的 是 ， 在 单 次 循环 
中 可 能 会 有 多 个 收敛 准则 同时 取得 最 佳 似 然 函数 值 ， LLaest 的 值 越 大 说 明 的 是 收敛 准则 的 表 
现 越 好 。LLmean、LLmax、LLmin 以 及 LLsa 表 示 500 次 重复 中 30 种 收敛 准则 分 别 对 应 的 对 数 
似 然 函数 值 的 均值 、 最 大 值 、 最 小 值 以 及 标准 差 ， 例 如 LLmean = mean(LLconv к)» 

其 他 评价 指标 还 包括 : 500 次 重复 中 30 种 收敛 准则 分 别 对 应 的 模型 参数 估计 程序 单 次 
运行 的 平均 时 间 (tmean; 单位 是 秒 ), 平均 迭代 次 数 (Itrmean), 实际 迭代 次 数 的 最 大 值 Gtrmax)， 
所 有 项 目 参 数 出 现 极端 值 的 总 数 (将 项 目 参数 大 于 1 或 者 是 小 于 -1 定义 为 极端 值 ， 表 示 为 
houb)， 以 及 模型 参数 估计 程序 未 收敛 次 数 的 总 次 数 。 

4.4 模拟 结果 

在 呈现 具体 结果 前 , 首先 对 两 个 一 般 性 的 结果 进行 说 明 。 本 研究 中 所 有 实验 条 件 组 合 下 
模拟 结果 显示 : (1) 当 最 大 迭代 次 数 为 50000 FF, 所 有 重复 中 的 模型 参数 都 收敛 了 , 没有 出 现 
未 收敛 情况 。 即 ,未 收敛 次 数 指标 均 为 0。(2) 在 相同 的 模型 参数 估计 框架 (GDINA 或 mCDM) 
及 收敛 容 差 (10-“、10-5 或 10-8) 下 ， 相 对 于 其 他 方法 而 言 , fl 方法 的 表现 是 最 差 的 ， 其 LLBest 
均 为 0。 因 此 ， 在 结果 部 分 不 再 呈现 1 方法 的 模拟 结果 。 

4.4.1 饱和 CDM 生成 数据 时 各 收敛 准则 的 表现 
1 中 呈现 的 是 使 用 饱和 G-DINA 生成 数据 ，J = 16, N = 500 条 件 下 除了 1 方法 外 的 
24 种 收敛 准则 的 表现 。 通 过 表 1 s s A 在 这 些 收 敛 准 则 中 ， 表 现 最 好 的 


T 


是 新 框架 mCDM 下 收敛 容 差 为 10-8 的 综合 判断 法 mcomp8。 就 收敛 判断 方法 而 言 ， 在 相同 
ПЕК, АЕ СОМА 框架 还 是 mCDM 框架 下 ， 表 现 最 好 的 是 comp 方法 ， 其 次 
是 dp 方法 ; ip 与 dp 方法 的 表现 较为 类 似 , 但 是 dp 的 表现 稍 好 ， 这 主要 是 因为 dp 是 模型 参 
数 ， 而 ip 是 参数 的 组 合 。 就 收敛 容 差 而 言 ， 同 一 模型 参数 估计 框架 和 收敛 判断 方法 下 ， 随 
着 收敛 容 差 变 小 ， 收 敛 准 则 的 表现 也 在 变 好 。 以 comp 方法 为 例 ， 随 着 收敛 容 差 从 10-4 变 化 
到 10-6，Gcomp 在 LLsa 指 标 上 近似 相等 但 是 在 LLgest、LLmean、LLmax、LLmin 指 标 上 的 表现 
在 变 好 ; mcomp 在 这 些 指标 上 的 表现 与 Gcomp 类 似 。 另外 需要 指出 的 是 , 当 收 敛 容 差 从 10-6 
变化 到 10-? 时 ,LLeest\LLmean、LLmax\、LLmin 等 指标 几乎 没有 明显 变化 , 但 是 可 以 发 现 Itrmean 
以 及 Itrmax 有 较 大 增长 。 就 模型 参数 估计 框架 而 言 , 可 以 明显 发 现 各 个 收敛 准则 在 mCDM HE 
架 下 的 表现 要 优 于 GDINA 框架 ， 一 个 明显 的 例子 是 ，mcomp8 在 LLpest 指 标 上 的 表现 优 于 
Gcomp8. ЖН mCDM 框架 下 tnmean 及 Mout 也 明显 优 于 GDINA 框架 。 通 过 Itrmax 指 标 可 以 发 
BL, 无 论 是 GDINA 还 是 mCDM 的 实际 所 使 用 的 迭代 次 数 的 最 大 值 都 超过 了 30000。 这 说 明 


— CDM 参数 估计 软件 中 最 大 迭代 次 数 默认 设置 是 不 合理 的 , 会 产生 模型 参数 不 收敛 的 错 


误 结 论 。 
根据 表 1 中 的 结果 ， 各 收敛 判断 方法 的 收敛 容 差 等 于 10-4 时 ， 在 LLaest 指 标 上 均 没有 好 
的 表现 ， 尽管 ip 类 方法 与 dp 类 方法 表现 类 似 , 但 是 ip 类 的 表现 相对 较 差 。 因 此 ， 模 型 完全 


正确 设 定 条 件 下 ， 不 再 呈现 收敛 容 差 为 104、 及 收敛 判断 方法 为 ip 时， 各 收敛 准则 的 模拟 


结果 。 

K 2 中 呈现 的 是 使 用 饱和 СОМ 生成 数据 ，J = 16 时 N= 1000 和 4000 两 种 样本 量 水 平 
下 各 收敛 准则 的 表现 。 在 N= 1000 样本 量 水 平 下 ， 表 现 最 好 的 收敛 准则 同样 是 mcomp8; `“ 
N=4000 且 收 敛 容 差 为 10-8 时 ， 表 2 中 各 收敛 准则 均 有 好 的 表现 。 综 合 比较 表 1 与 表 2， 可 
以 发 现 随 着 样本 量 的 增加 : (收敛 容 差 为 10-5 和 10-8 的 dp. ll. 以 及 Gcomp 方法 在 LLBest、 
LLmean、LLmax、LLmin 等 指标 上 的 表现 都 在 变 好 , 但 是 相对 而 言 收敛 容 差 为 10-8 时 各 方法 的 
表现 更 好 ，(2)Itrmean、Itrmax 及 Xout 指 标 均 在 变 小 ， 甚 至 N= 4000 时 4out 等 于 0; (3) 在 N= 
500 和 1000 水 平 下 ，mCDM 框架 下 各 收敛 准则 的 表现 优 于 GDINA 框架 , {Н N = 4000 时 
GDINA 框架 下 大 部 分 收敛 准则 的 表现 与 mCDM 框架 基本 一 致 。 

表 3 中 呈现 的 是 数据 生成 模型 为 饱和 模型 ，J= 32 水 平 下 的 模拟 研究 结果 ， 由 于 所 有 重 
复 中 没有 极端 值 ， 因 此 表 中 没有 呈现 4out 列 。 另 外 ， 通 过 表 1 及 表 2 中 的 结果 可 以 发 现 ， 各 
收敛 判断 方法 在 10-8 的 收敛 容 差 水 平 下 的 表现 明显 优 于 10-5 水 平 ， 因 此 不 再 呈现 dp. H 类 
方法 在 10 习 的 收敛 容 差 水 平 下 的 全 部 结果 ， aa mcomp 方法 下 的 结果 用 于 比较 说 明 。 表 


3 同样 显示 在 LLpest 指 标 上 表现 最 好 的 是 mcomp8。 也 就 是 说 ， 模 型 完全 正确 设 定 条 件 下 , 在 
本 文 所 探讨 的 全 部 收敛 准则 中 ，mcompg 表现 最 好 。 


K1 饱和 CDM 生成 数据 ，J= 16, №= 500 条 件 下 的 模拟 结果 


收敛 准则  LLgest  LLmean LLinax LLinin Ма  tmean вап Itr Дош 

Gdp4 0 -4948.024 -4847.235 -5054.561 34.436 0.540 180 848 62 

Gdp6 240 -4948.011  -4847.226 -5054.557 34.437 1.181 474 5752 6l 

Gdp8 280 -4948.011 -4847.226  -5054.557 34.437 2.068 901 32057 6l 

Gip4 0 -4948.027 -4847.234 -5054.561 34.438 0.507 164 730 59 

Gip6 232 -4948.011 -4847.226 -5054.557 34437 1.131 452 5680 61 

Gip8 279 -4948.011 -4847.226 -5054.557 34.437 1847 863 28030 61 
Г Gll4 0 -4948.024 -4847.229 -5054.558 34.438 0.520 169 844 60 
e 3 GII6 48 -4948.017  -4847.226  -5054.557 34.431 0.858 329 1819 6 
GII8 273 -4948.011  -4847.226 -5054.557 34437 1217 531 6760 61 

Gcomp4 0 -4948.022 -4847.229  -5054.558 34.436 0.5666 190 848 62 


Gcomp6 240 -4948.011 -4847.226 -5054.557 34.437 1.189 478 5752 61 


Gcomp8 281 -4948.011 -4847.226 -5054.557 34.437 2.062 905 32057 6l 


mdp4 0 -4948.021 -4847.234 -5054.560 34.436 0.254 179 877 59 

} mdp6 360 -4948.008 -4847.226 -5054.556 34.437 0.461 479 5803 59 
= mdp8 498 -4948.008 -4847.226 -5054.556 34.437 0.735 953 32053 59 
mip4 0 -4948.022 -4847.234  -5054.560 34.436 0.241 165 774 58 

mip6 346 -4948.012 -4847.226 -5054.556 34.441 0.432 453 5730 59 

тір8 496 -4948.008 -4847.226 -5054.556 34.437 0.690 912 28026 59 

mll4 0 -4948.021 -4847.228 -5054.557 34.437 0.240 168 923 57 

mll6 69 -4948.018 -4847.226 -5054.556 34.435 0.349 335 1978 59 

mll8 485 -4948.008 -4847.226 -5054.556 34.437 0.495 585 6756 59 

mcomp4 0 -4948.019 -4847.228 -5054.557 34.435 0.258 189 923 59 


mcomp6 363 -4948.008 -4847.226 -5054.556 34.437 0.462 485 5803 59 


mcomp8 500 -4948.008 -4847.226 -5054.556 34.437 0.734 958 32053 59 
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mi 
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3 2 饱和 CDM 生成 数据 ，J= 16, М= 1000 № 4000 条 件 下 的 模拟 结果 


М ЦЭ Ш.в LL а LE s LES LLsa toa Tian Itras Adui 
1000 Gdp6 457 -9929.20 -9801.836 -10105.797 49.742 1.057 291 1924 6 
Gdp8 487 -9929.20 -9801.836 -10105.797 49.742 1.660 508 6609 6 

GII6 117 -9929.20 -9801.836 -10105.797 49.742 0.831 217 713 6 

С118 481 -9929.20 -9801.836 -10105.797 49.742 1.107 324 2512 6 
Gcomp6 457 -9929.20 -9801.836 -10105.797 49.742 1.066 295 1924 6 
Gcomp8 487 -9929.20 -9801.836 -10105.797 49.742 1.666 511 6609 6 

mdp6 460 -9929.20 -9801.836 -10105.797 49.742 0.468 288 1950 6 

mdp8 499 -9929.20 -9801.836 -10105.797 49.742 0.726 503 6628 6 

mll6 104 -9929.20 -9801.836 -10105.797 49.742 0.362 213 795 6 

mll8 494 -9929.20 -9801.836 -10105.797 49.742 0.489 323 2509 6 
тсотрб 461 -9929.20 -9801.836 -10105.797 49.742 0471 291 1950 6 
mcomp8 500 -9929.20 -9801.836 -10105.797 49.742 0.728 507 6628 6 

4000 арб 469 -39831.617  -39539.020 -40187.183 102.360 2.588 223 321 0 
Gdp8 500  -39831.617 -39539.020  -40187.183 102.360 3.840 354 506 0 

GII6 200 -39831.617 -39539.020  -40187.183 102.360 2.334 195 282 0 

GII8 499 -39831.617  -39539.020 -40187.183 102.360 2.947 261 376 0 
Gcomp6 475 -39831.617  -39539.020 -40187.183 102.360 2.596 224 322 0 
Gcomp8 500  -39831.617 -39539.020  -40187.183 102.360 3.825 356 511 0 

mdp6 463 -39831.617  -39539.020 -40187.183 102.360 1.612 209 312 0 

mdp8 500 -39831.617 -39539.020  -40187.183 102.360 2.376 341 490 0 

mll6 177 -39831.617  -39539.020 -40187.183 102.360 1.443 182 257 0 

mll8 499 -39831.617  -39539.020 -40187.183 102.360 1.774 247 352 0 
тсотрб 471 -39831.617 -39539.020 -40187.183 102.360 1.619 211 312 0 
mcomp8 500 -39831.617  -39539.000 -40187.183 102.360 2.372 342 490 0 
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43 饱和 CDM 生成 数据 ，J= 32 条 件 下 的 模拟 结果 


N WEB) Шве вау LLinax Шо Ша fosa dun. es 
500 Gdp8 485 -9334.716 -9163.342 -9521.124 61.640 0.551 77 311 
GII8 484 -9334.716 -9163.342 -9521.124 61.640 0.452 53 328 
Gcomp8 485 -9334.716 -9163.342 -9521.124 61.640 0.552 77 328 
mdp8 500 -9334.716 -9163.342 -9521.124 61.640 0.235 77 619 
mll8 499 -9334.716 -9163.342 -9521.124 61.640 0.203 54 609 
mcomp6 492 -9334.716 -9163.342 -9521.124 61.640 0.205 52 320 
mcomp8 500 -9334.716 -9163.342 -9521.124 61.640 0235 77 619 
1000 Gdp8 500 -18731.384  -18516.735 -19016929 93.430 0.682 65 95 
GII8 500 -18731.384  -18516.735 -19016.929 93.430 0.574 47 66 
Gcomp8 500  -18731.384  -18516.735 -19016.929 93.430 0.682 65 95 
mdp8 500  -18731.384  -18516.735 -19016.929 93.430 0.315 64 95 
mll8 500 -18731.384  -18516.735 -19016.929 93.430 0.266 46 66 
mcomp6 498 -18731.384  -18516.735 -19016.929 93.430 0.263 44 64 
mcomp8 500  -18731.384  -18516.735 -19016.929 93.430 0315 64 95 
4000 Gdp8 500 -75137.975  -74638.007 -75645.526 185.720 1.998 60 71 
GII8 500 -75137.975  -74638.007 -75645.526 185.720 1.811 48 55 
Gcomp8 500  -75137.975  -74638.007 -75645.526 185.720 1.993 60 71 
mdp8 500 -75137.975  -74638.007 -75645.526 185.720 1.463 58 72 
mll8 500 -75137.975  -74638.007  -75645.526 185.720 1210 46 56 
mcomp6 489 -75137.975  -74638.007 -75645.526 185.720 1.108 39 50 
тсотр8 500 -75137.975  -74638.007 -75645.526 185.720 1.457 58 72 
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对 比 表 3 中 不 同样 本 量 条 件 下 各 个 收敛 准则 的 表现 ， 可 以 发 现 : (1)N = 500 IN, mCDM 
框架 下 的 大 多 数 收敛 判断 方法 在 LLpest 指 标 上 的 表现 优 于 GDIN4 框架 ;N= 1000 和 4000 时 ， 


GDINA 框架 下 各 收 全 准则 的 表现 在 变 好 ， 且 当 收 人 钱 容 差 为 10-5 时 mCDM 和 


GDINA 框架 下 


各 收敛 准则 均 有 好 的 表现 。(2) 就 Itrmean、Itrmax 指 标 而 言 ， 随 着 样本 量 的 增 大 ， 这 两 个 指标 


在 变 小 。 这 说 明 J= 32 时 ， 随 着 样本 量 的 增 大 ， 所 需要 的 迭代 次 数 在 变 少 。 
4.4.2 HCDM 生成 数据 时 各 收敛 准则 的 表现 


X 4 到 表 6 呈现 的 是 通过 HCDM( 前 三 个 属性 是 线性 层级 关系 ) 生 成 作答 反应 数据 但 


用 饱和 CDM 估计 模型 参数 条 件 下 的 模拟 结果 。 


E 


— 


根据 表 4 中 的 结果 ， 可 以 发 现在 所 有 收敛 准则 中 ，mCDAM 框架 下 mcomp8 的 表现 是 最 


好 的 ， 相 同 收敛 容 差 下 mdp 的 表现 接近 mcomp。 根 据 LLpest、LLmean、LLmax、LLmin 指 标 ， 


可 以 发 现 mCDM 框架 下 各 收敛 准则 的 表现 远 优 于 GDINA 框架 。 就 收敛 容 差 而 言 , mCDM HE 


架 下 收敛 容 差 的 三 个 水 平 下 ， 各 个 方法 的 LLgest、LLmean、LLmax、LLmin 等 指标 表现 有 明显 


差异 。 随 着 收 和 敛 容 差 的 变 小 ,各 个 方法 的 表现 也 在 变 好 ，10-8 下 各 个 方法 的 表现 是 最 佳 的 。 


结合 表 1, 可 以 发 现 表 4 中 各 收敛 准则 在 收 和 敛 容 差 的 10 “与 10 一 两 个 水 平 下 的 表现 的 差异 更 
加 明显 。 就 迭代 次 数 而 言 ，mCDM 及 GDINA 下 表现 最 好 的 comp8 的 最 大 迭代 次 数 均 大 于 


10000 次 ， 这 说 明 在 样本 量 较 小 的 条 件 下 (如 N= 500)， 如 果 将 迭代 次 数 设 置 的 过 小 (如 ， 小 


于 10000) 模 型 参数 估计 程序 可 能 会 输出 不 收敛 的 错误 结论 。 由 表 4 中 的 4out 指 标 可 知 ， 在 


500 次 循环 中 Gcomp8 中 有 591 个 参数 存在 极端 值 问 题 ,mCDM 框 架 下 的 极端 值 数量 为 483。 
这 说 明 ， 尽 管 mCDM 框架 能 有 效 减少 极端 值 数量 ， 但 是 与 表 1 中 的 极端 值 数量 进行 对 比 可 


Ns 
zt 


以 发 现 边界 值 问题 对 于 2 种 框架 下 的 模型 参数 均 产生 较为 负面 的 影响 。 


Y 


Z. 


合 表 1 与 表 4， 在 模型 中 存在 边界 值 条 件 下 同样 发 现 : (Пар 与 ip 方法 的 表现 具有 较 


高 的 一 致 性 ， 且 dp 的 表现 与 ip 相当 或 优 于 ip，(2) 收 敛 容 差 等 于 10 一 时 各 收敛 判断 方法 的 


表现 , 均 没 有 优 于 10 -或 是 10-* 这 两 个 收敛 容 差 下 的 表现 。 因 此 , Be Fo Sp 
在 边界 值 条 件 下 ip 方法 及 收敛 容 差 等 于 10 一 时 各 收敛 准则 的 结果 。 


ШЖ 5 中 N = 1000 及 4000 水 平 下 的 模拟 结果 可 知 ， 在 LLpest 指 标 上 表现 最 佳 仍然 是 


呈现 模型 中 存 


mcomp8， 其 次 是 mdp8。 就 收敛 容 差 而 言 ， 各 个 收敛 准则 在 10- 与 10 8 水平 下 的 LLeest 和 
LLmean 指 标 上 表现 出 了 明显 的 差异 , 收敛 容 差 为 10-8 时 这 两 个 指标 更 好 。 模型 参数 估计 框架 
对 各 收敛 准则 的 表现 产生 了 明显 影响 , 整体 而 言 , 在 本 研究 使 用 的 所 有 指标 上 , mCDM 框架 
下 各 收敛 准则 的 表现 优 于 GDINA 框架 。 样 本 量 对 .7= 16 且 模 型 中 存在 边界 值 时 的 各 收敛 准 
则 在 iout 指 标 上 的 表现 同样 产生 了 影响 ， 综 合 表 4 与 表 5， 可 以 发 现 随 着 样本 量 的 增加 各 收 
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敛 准则 对 应 的 4uut 的 数量 在 下 降 。 就 Itraax 而 言 ， 模 型 中 存在 边界 值 时 ,mm CDM 和 GDINA HE 
架 下 表现 较 好 的 模型 收敛 准则 中 需要 的 迭代 次 数 都 非常 大 。 例 如 ，N=4000 条 件 下 mcomp8 


` 


需要 的 最 大 迭代 次 数 为 12714，Gcomp8 需要 的 迭代 次 数 是 12509, ЗН CDM 或 GDINA 
软件 包 中 默认 的 迭代 次 数 。 


表 4HCDM 生成 数据 ，J= 16, N=500 条 件 下 的 模拟 结 

收敛 准则 Шз  LLmean LLmax М.а Па  tmean Ttrmean Itrmax Лош 

Gdp4 1 -4775.050 -4640.212 -4885.902 39.080 0.560 184 870 585 

Gdp6 22 -4775.034 -4640.210 -4885.901 39.076 1.276 500 5131 589 

Gdp8 27 -4775.033 -4640.210 -4885.901 39.075 2.175 937 23818 591 

Gip4 1 -4775.051 -4640.212 -4885.904 39.081 0.543 176 795 585 

т Gip6 21 -4775.034 -4640.210 -4885.901 39.075 1.231 485 5141 589 
Г Gip8 27 -4775.033 -4640.210 -4885.901 39.075 2.110 922 23818 591 
014 0 -4775.048 -4640.214 -4885.902 39.080 0.516 161 714 584 

GIl6 12 -4775.036 -4640.210 -4885.901 39.074 0.833 308 1461 588 

GII8 25 -4775.033 -4640.210 -4885.901 39.075 1.284 535 6486 589 

Gcomp4 1 -4775.048 -4640.212 -4885.902 39.080 0.574 189 870 588 

Gcomp6 22 -4775.034 -4640.210 -4885.901 39.076 1.279 501 5141 589 

Gcomp8 27 -4775.033 -4640.210 -4885.901 39.075 2.179 939 23818 591 

} mdp4 4 -4774.975 -4639.179 -4885.899 39.103 0.221 185 739 486 
= mdp6 350 -4774.968 -4639.178 -4885.898 39.100 0.403 475 4339 484 
mdp8 469 -4774.964 -4639.178 -4885.898 39.101 0.686 931 14029 483 

mip4 4 -4774.975 -4639.179 -4885.901 39.103 0.214 179 735 490 

mip6 343 -4774.968 -4639.178 -4885.898 39.100 0.387 464 4303 484 

mip8 469 -4774.964 -4639.178 -4885.898 39.101 0.647 916 14029 483 

mll4 0 -4774.980 -4639.184 -4885.898 39.102 0.201 161 910 473 

mll6 72 -4774.969 -4639.178 -4885.898 39.100 0.292 312 1471 482 

mll8 458 -4774.965 -4639.178 -4885.898 39.101 0.431 558 5066 486 

mcomp4 4 -4774.974 -4639.179 -4885.898 39.103 0.223 191 910 481 

mcomp6 351 -4774.968 | -4639.178 -4885.898 39.100 0.404 479 4339 484 

mcomp8 473 -4774.964 -4639.178 -4885.898 39.101 0.684 936 14029 483 
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#5 HCDM 生成 数据 ，J=16，N = 1000 № 4000 条 件 下 的 模拟 结 
N ЗО вех  LLmean LL max LLmin LLsa tmean Itrmean Itrmax Aout 
1000 Gdp6 9 -9577.383 -9408.520 -9787.279 56.515 1.547 450 5095 491 
Gdp8 12 -9577.379 -9408.520 -9787.279 56.515 2.667 843 17947 494 
СПб 3 -9577.389 -9408.520 -9787.279 56.510 1.054 285 1685 491 
Gll8 11 -9577.385 -9408.520 -9787.279 56.509 1.558 476 5786 495 
Gcomp6 9 -9577.383 -9408.520 -9787.279 56.515 1.546 451 5095 491 
Gcomp8 12 -9577.379 -9408.520 -9787.279 56.515 2.672 844 17947 494 
mdp6 366 -9577.314 -9408.518 -9787.279 56.508 0.635 467 5512 416 
mdp8 484 -9577.313 -9408.518 -9787.279 56.508 1.171 969 18411 411 
mll6 78 -9577.319 -9408.518 -9787.279 56.503 0.410 285 1686 409 
mll8 470 -9577.319 -9408.518 -9787.279 56.503 0.647 510 5843 415 
mcompó 370 -9577.314 -9408.518 -9787.279 56.508 0.636 469 5512 416 
mcomp8 488 -9577.313 -9408.518 -9787.279 56.508 1.173 972 18411 411 
4000 Gdp6 14 -38423.227 -38076.036 -38778.783 117.696 6.011 604 3920 424 
Gdp8 23 -38423.225 -38076.036 -38778.783 117.696 10.439 1132 12509 427 
СПб 5 -38423.228  -38076.036 -38778.783 117.696 3.937 375 2066 425 
Gll8 22 -38423.226 -38076.036 -38778.783 117.697 6.492 698 4557 425 
Ссотрб 14 -38423.227 -38076.036 -38778.783 117.696 6.082 612 3920 425 
Ссотр8 23 -38423.225 -38076.036 -38778.783 117.696 10.473 1141 12509 427 
тарб 276 -38423.146 -38076.034 -38778.782 117.698 3.437 595 3957 356 
тар8 473 -38423.145 -38076.034 -38778.782 117.698 6.393 1233 12714 355 
mll6 28 -38423.146 -38076.034 -38778.782 117.697 2.253 374 2076 357 
118 460 -38423.145  -38076.034 -38778.782 117.698 3.831 733 4569 355 
тсотрб 276 -38423.146 -38076.034 -38778.782 117.698 3.472 602 3957 356 
тсотр8 478 -38423.145 -38076.034 -38778.782 117.698 6.424 1241 12714 355 
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+ 6 HCDM 生成 数据 ，J= 32 条 件 下 的 模拟 结 


М ИЗ Мех LLmean LL max LLmin LL;a tmean Itrmean Itrmax Лош 
500 Gcomp8 83 -8944.542 -8746.172 -9101.048 63.686 0.823 143 4521 1072 
mdp8 416 -8944.529 -8746.349 -9100.836 63.714 0.309 162 3678 936 
mll8 417 -8944.529 -8746.349 -9100.836 63.714 0.241 109 1701 916 


mcomp6 390 -8944.531 -8746.349 -9100.836 63.713 0.240 101 1575 921 


mcomp8 417 -8944.529 -8746.349 -9100.836 63.714 0.310 163 3678 936 


1000 Ссотр8 44 -17941.473  -17692.040 -18203.752 96.770 1.375 179 6530 998 


mdp8 456 -17941.322  -17692.038  -18205.384 96.780 0.607 218 12877 810 


mll8 452 -17941.322  -17692.038  -18205.384 96.780 0.411 124 1840 805 


mcomp6 408 -17941.322  -17692.038 -18205.384 96.780 0.420 115 3035 809 


mcomp8 456 -17941.322  -17692.038 -18205.384 96.780 0.610 219 12877 810 


4000 Ссотр8 51 -71973.595 -71443.652 -72679.347 198.161 7.854 278 7908 913 


mdp8 443 -71973.490 -71443.649 -72679.344 198.184 5.795 299 6037 714 


mll8 443 -71973.494 -71443.649 -72679.344 198.185 3.729 191 1799 706 


тсотрб 373 -71973.496 -71443.649 -72679.344 198.184 3.470 164 1833 717 


mcomp8 449 -71973.490  -71443.649 -72679.344 198.184 5.896 303 6037 714 


通过 表 4 与 表 5 中 的 结果 可 知 ， 模 型 估计 框架 为 mCDM、 收 敛 容 差 为 10-8 时 各 收敛 准 
则 的 表现 更 好 。 因 此 ， 表 6 中 不 再 呈现 GDINA 框架 及 10 到 4、10-5 收 敛 容 差 下 完整 的 模拟 结 
果 ， 仅 包含 Gcomp8 及 mcomp6 用 于 结果 比较 。 表 6 中 呈现 的 是 模型 中 存在 边界 值 且 .7=32 
时 的 模拟 结果 。 可 以 发 现在 N = 500, 1000 及 4000 这 三 个 样本 量 水 平 下 表现 最 好 的 收敛 准 
则 都 是 mcomp8，mdp8 与 mll8 的 表现 相对 较 好 。 就 模型 参数 估计 框架 而 言 : (1)mCDM 框架 
下 各 收敛 准则 在 LLpest、LLmean、tmean、4hout 等 指标 上 的 表现 优 于 相同 收敛 准则 在 GDINA HE 
架 下 的 表现 ，(2)mCDM 框架 下 收敛 容 差 的 值 对 各 收敛 方法 的 表现 有 明显 影响 ， 收 敛 容 差 的 
值 越 小 ， 同 一 收敛 判断 方法 在 LLgest、LLmean 指 标 上 的 表现 越 好 。 样 本 量 对 于 各 收敛 准则 对 
应 的 Xout 指 标 产 生 了 明显 的 影响 ， 同 一 种 收敛 准则 下 样本 量 越 大 Xout 的 值 越 小 。 对 比 相同 收 
SHE MUZE J=16( 表 4 与 表 5) 及 J=32 水 平 下 的 Itrmean 和 Itrmax 指 标 上 的 表现 ， 可 以 发 现 随 着 
项 目 量 增 大 Itrmean 和 Itrmax 在 下 降 ， 然而 需要 特别 指出 的 是 ， 即 使 在 = 32 ЖЕ Г Gcomp8 


和 mcomp8 收敛 准则 中 的 Itraax 仍 可 能 大 于 3000. 
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5 实证 数据 分 析 

数据 来 源 于 Yuan 等 人 (2022) 关 于 小 学 数学 分 数 运算 的 认 知 诊断 研究 。 这 个 数据 集 包含 
817 名 被 试 对 56 个 项 目的 作答 。Yuan 等 人 (2022) 在 文献 分 析 的 基础 上 ， 根 据 专家 建议 、 被 
试 访谈 及 口语 报告 法 等 , 定义 了 5 个 认 知 属性 , 分 别 是 : 基本 运算 (qj)、 294) (a2). 387) (3). 
带 分 数 拆 分 (qay)、 借 位 (qs)。 其 研究 提出 分 数 运算 认 知 过 程 的 可 能 路 径 是 : 掌握 gj 是 掌握 ag,、 
Qa、Qs 的 前 提 ; 由 于 属性 ws 仅 涉及 将 整数 与 分 数 部 分 拆 开 , 不 需要 预先 掌握 ci; 图 4 中 呈现 
了 认 知 属性 层级 关系 图 。Yuan 等 人 (2022) 使 用 似 然 比 统计 量 比较 了 logit 连接 函数 下 饱和 
CDM 与 HCDM 的 对 数 似 然 函 数值 的 差异 ,初步 证 实 了 小 学 数学 分 数 运算 数据 集中 存在 图 


中 所 呈现 的 层级 关系 。 


图 4 Yuan 等 人 (2022) 定 义 的 小 学 数学 分 数 运算 认 知 属性 层级 关系 


+ 


本 文 以 小 学 数学 分 数 运算 数据 集 为 例 ， 探 讨 当 CDM 模型 中 存在 边界 值 时 ，GDINA4 № 
mCDM 模型 参数 估计 框架 下 ,5 种 收敛 判断 方法 (dp、ip、1L rl. comp), 3 种 收敛 容 差 (104、 
1075. 1079), PRL BEY 30 种 收敛 判断 准则 的 表现 。 表 7 中 呈现 了 这 30 种 收敛 准则 对 应 的 
对 数 似 然 函 数值 ( 简 记 为 ，LL)， 以 秒 为 单位 的 模型 参数 估计 时 间 (D， 和 迭代 次 数 以 及 iout; 为 
便于 结果 解释 ， 将 LL 值 保 留 到 了 小 数 点 后 四 位 。 

根据 模型 参数 估计 的 极 大 似 然 理论 ， 收 敛 判 断 准则 对 应 的 LL 越 大 ， 说 明 这 个 准则 的 表 
现 越 好 ， 模 型 参数 点 估计 值 的 可 靠 性 越 高 。 

可 以 发 现 : (1) 对 于 LL 值 影响 最 大 的 是 模型 参数 估计 框架 ， 本 研究 中 新 开发 的 mCDM 
框架 下 各 收敛 准则 对 应 的 LL 值 远大 于 GDINA 框架 下 各 收敛 准则 对 应 的 LL 值 。(2) 在 所 有 
收敛 准则 中 表现 最 好 的 是 mdp8 与 mcomp8， 在 这 两 种 收敛 准则 中 不 仅 似 然 函 数 是 最 大 的 ， 


u 


而 且 项 目 参 数 中 没有 极端 值 。(3) 就 3 种 收敛 容 差 而 言 ， 不 论 是 在 mCDM 还 是 GDINA 框架 
下 ，10“ 的 表现 都 是 最 差 的 ，10 习 的 表现 是 最 佳 的 ， 尽 管 在 一 些 收敛 准则 中 10 怕 的 表现 与 
10 习 类似, 但 是 前 者 并 不 具有 普遍 适用 性 。 以 上 3 个 发 现 与 模拟 研究 中 的 结论 具有 高 度 的 
Sut. 
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收敛 准则 


AT 实证 数 扩 


GDINA 框架 


LL t I 


Gdp4 -14307.9718 1.040 133 4 
Gdp6 -14307.9717 1.328 190 4 
Gdp8 -14307.9717 1.686 247 4 
Gip4 -14307.9719 0.914 123 4 
Gip6 -14307.9717 1.299 181 4 
Gip8 -14307.9717 1.631 238 4 
Gll4 -14307.9720 0.891 119 4 
GII6 -14307.9717 1.128 148 4 
GII8 -14307.9717 1.245 177 4 
Grl4 -14351.6261 0.264 20 4 
Grl6 -14308.0450 0.448 47 4 
Grl8 -14307.9725 0.856 11 4 
Gcomp4 -14307.9718 1.040 133 4 
Gcomp6 -14307.9717 1.328 190 4 
Gcomp8 -14307.9717 1.686 247 4 
6 讨论 与 展望 
本 文通 过 理论 分 析 及 模拟 研究 证 实 , OA 


虽 分 析 结 果 


mCDM 框架 


Cov LL 
mdp4 -14248.5465 
mdp6 -14248.5463 
mdp8 -14248.5463 
mip4 -14248.5469 
mip6 -14248.5463 
mip8 -14248.5463 
mll4 -14248.5465 
mll6 -14248.5463 
mll8 -14248.5463 
mrl4 -14257.7213 
mrl6 -14248.6033 
mrl8 -14248.5469 

mcomp4  -14248.5465 
mcomp6  -14248.5463 


mcomp8  -14248.5463 


t Itr Аы 
0.470 64 1 
0.718 111 1 
0.975 158 0 
0.423 58 0 
0.670 105 1 


0.925 152 1 


0.698 110 2 


计量 模型 的 点 估计 值 在 一 些 情景 中 会 存在 可 千 


性 问题 ， 且 新 开发 的 模型 参数 估计 框架 及 收敛 准则 能 够 提高 模型 参数 估计 值 的 可 靠 性 。 


6.1 讨论 


首先 ， 通 过 预 研 究 作者 认为 最 大 迭代 次 数 设 置 过 少 可 能 会 导致 模型 参数 不 收敛 的 问题 


(WH, 3000 或 以 下 ， 见 GDINA 及 CDM #1 


FEL), 


因此 本 研究 将 最 大 迭代 次 数 设置 为 50000。 


模拟 研究 发 现 ， 本 文 所 有 实验 条 件 组 合 下 mCDM 和 GDINA 这 两 种 模型 参数 估计 框架 均 收 
敛 。 模 拟 研 究 显示 在 一 些 特定 条 件 下 ( 见 表 1), mCDM 和 СГМА 的 最 大 友 代 次 数 均 超 过 了 
30000 次 ， 这 也 就 意味 着 如 果 将 最 大 收敛 次 数 设置 为 3000 那么 就 会 出 现 模型 参数 不 收敛 的 


问题 。 因此 ,本 文 认 为 增 大 模型 参数 估计 程序 的 最 大 迭代 次 数 有 助 于 解决 模型 参数 不 收敛 问 


题 。 
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其 次 , 针对 CDM 中 可 能 存在 的 边界 值 以 及 项 目 参 数 存在 极端 值 问题 ， 本 文 开 发 了 新 的 


CDM 模型 参数 估计 框架 mmCDM。 通 过 对 比 mCDM 和 GDINA 这 两 种 模型 参数 估计 框架 在 模 


KRK 


FE 数 据 分 析 中 的 表现 ， 发 现 mCDM 框架 的 表现 优 于 或 至 少 与 GDINA 框架 的 表 


MA; Н mCDM 框架 有 效 减少 了 项 目 参数 极端 值 数量 。 因 此 ， 本 文 认为 在 估计 CDM 模 
型 参数 时 , mCDM 可 能 是 一 个 更 好 的 选择 。 导致 CDM 中 存在 边界 值 的 一 个 原因 是 属性 间 存 


在 层级 关系 ， 使 得 饱和 CDM 中 的 一 些 参数 近似 等 于 0。 研 究 者 以 饱和 CDM 为 基础 开发 了 


一 些 属性 层级 关系 探索 或 验证 的 方法 (Gu & Xu 2019; Liu et al., 2022; Templin & Bradshaw, 
2014). 我 们 建议 研究 者 进一步 在 mCDM 框架 下 使 用 已 有 方法 或 者 是 开发 新 方法 对 属性 层级 
关系 进行 研究 。 当 有 较为 充分 的 证 据 证 明 层级 关系 存在 时 , 在 mCDM 框架 下 使 用 HCDM 分 


析 数 据 ， 可 


能 会 提高 模型 参数 点 估计 值 的 可 靠 性 。 


第 三 ， 本 文 新 提出 模型 参数 收敛 综合 判断 法 сотр, HE 2 种 参数 估计 框架 (mCDM 和 


СОМА). З 种 收敛 容 差 (10-4、10-6、10-8) 下 比较 了 dp. ip. 1. rl 及 comp 等 方法 所 组 成 的 
30 种 收敛 准则 的 表现 。 就 本 研究 所 探讨 的 3 种 收敛 容 差 而 言 ，10-8 的 表现 是 最 好 的 ，10-4 
的 表现 则 不 及 10 习 和 10-8， 收 敛 容 差 的 值 越 小 收敛 准则 的 表现 越 好 ， 尤 其 是 在 mCDM 框架 
®t dp. ip. 1. ИМ comp 这 五 种 收敛 判断 方法 而 言 ，comp 的 表现 最 好 ,1 方法 的 表现 
028; 在 mCDM 框架 下 表现 最 为 明显 。 因 此 ， 本 文 认为 ， 估 计 模 型 参数 时 ，mCDM 框架 下 
收敛 容 差 为 10-8 的 comp 方法 的 可 靠 性 较 高 。 

6.2 展望 


本 文 以 同一 连接 下 的 饱和 G-DINA 模型 为 例 ， 探 讨 了 mCDM 和 GDINA 框架 下 目前 已 


F. 


有 的 及 本 研究 新 开发 的 各 收敛 准则 在 COM 模型 参数 估计 中 的 表现 。 尽管 本 研 
在 CDM 模型 参数 估计 时 如 何 选择 恰当 收敛 准则 的 问题 , 但 是 作者 认为 有 以 下 几 个 问题 需要 
进 一 


初步 解决 了 


ot 


第 一 个 是 关于 п 方法 所 适用 的 收敛 容 差 问题 。 本 文 发 现 ， 相 对 于 其 他 准则 而 言 ，zl HX 


10-4、10-56、10-8 这 三 种 收敛 容 差 值 时 在 LLgest、LLmean 指 标 上 的 表现 均 较 差 。 通 过 zl 的 计 
HH Kabs{[e(ye?* |у) — (үс |у) | /2(ус+0|у)), £i арр) daa RR Н 
现 的 原因 。 以 
框架 下 且 收 敛 准 则 值 等 于 10-8 时 的 表现 ， 相 对 于 其 他 框架 及 收敛 容 差 较 优 。 根 据 mll8 的 定 
У, аһ {—2[2(үс+0|у) — e(yCe?|y)]) < 10-8; 再 根据 表 中 的 LLmean 值 -4948.008， 可 


近似 获得 此 时 mll 的 值 ， 并 计算 тап, 


mrl = 


1 中 呈现 的 模拟 结果 为 例 , 可 以 发 现在 这 个 实验 条 件 组 合 下 ,1 方法 在 mCDM 


аЬ [2(ү+ у) — e(ytre?|y)]/z(y&ee*?|y)) < 10-8/(2 х 4948.008) (10) 
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这 也 就 意味 着 ， 如 果 ml 想 要 达到 与 mll8 相近 的 效果 ， mrl 方法 的 收敛 容 差 应 该 近似 等 于 
10-。 因 此 ， 作 者 建议 后 续 研 究 者 可 以 沿 着 这 个 线索 继续 探索 1 方法 的 表现 。 

第 二 是 关于 mCDM 框架 及 其 应 用 的 问题 。 本 研究 开发 mCDM 框架 的 主要 目的 在 于 提供 
一 个 更 加 合理 的 СОМ 模型 参数 估计 框架 ， 尽 量 减少 模型 参数 不 收敛 、 边 界 值 问题 及 项 目 参 
数 极端 值 对 CDM 模型 参数 收敛 准则 表现 的 影响 。 特别 说 明 的 是 模拟 实验 中 将 最 大 迭代 次 数 
设置 为 50000 IF, 两 种 参数 估计 框架 下 的 所 有 循环 中 的 参数 估计 都 收敛 了 ,因此 在 本 研究 
mCDM 框架 仅 在 边界 值 问题 及 项 目 参 数 存在 极端 值 时 起 作用 。 模 型 中 存在 边界 值 时 ， 尽 
mCDM 框架 下 的 项 目 极端 值 数量 少 于 同 条 件 下 GDINA 框架 所 对 应 的 数量 ， 但 即使 是 在 N 
4000 条 件 下 , mCDM 框架 下 出 现 极 端 值 的 频率 仍然 较 高 。 因 此 , 本 研究 认为 有 必要 以 mCDM 
框架 为 基础 ， 继 续 对 模型 参数 不 收敛 、 边 界 值 问题 及 项 目 参数 极端 值 等 问题 展开 探索 。 

第 三 , 不 同 连接 函数 下 各 种 收敛 准则 的 表现 有 待 进一步 探索 。 本 文 以 同一 连接 下 的 饱和 
G-DINA 模型 为 例 ,探讨 了 不 同 收敛 准则 的 表现 。 但 СОМ 中 还 有 两 种 得 到 广泛 应 用 的 连接 : 
logit 连接 以 及 log 连接 (de la Torre, 2009, 2011; Templin & Bradshaw, 2014)。 这 三 种 连接 函数 
的 主要 区 别 之 一 是 ， 项 目 参数 与 项 目 正确 作答 概率 之 间 关 系 的 表达 不 同 。 鉴 于 dp 的 表现 在 
大 多 数 情况 下 略 优 于 ip， 本 研究 认为 后 续 研究 可 以 对 不 同 连接 函数 下 各 个 收敛 准则 的 表现 
展开 进一步 探索 。 


+ 


me 
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Abstract 

Cognitive diagnostic models (CDMs) are psychometric models which have received increasing 
attention within the field of psychological, educational, social, biological, and many other 
disciplines. It has been argued that an inappropriate convergence criterion for MLE-EM (maximum 
likelihood estimation using the expectation maximization) algorithm could result in unpredictably 
distorted model parameter estimates, and thus may yield unstable and misleading conclusions drawn 
from the fitted CDMs. Although several convergence criteria have been developed, it remains an 
unexplored question, how to specify the appropriate convergence criterion for the fitted CDMs. 

A comprehensive method for assessing convergence is proposed in this study. To minimize the 
impact by the model parameter estimation framework, a new framework adopting the multiple 
starting values strategy mCDM is introduced. To examine the performance of the convergence 
criterion for MLE-EM in CDMs, a simulation study under various conditions was conducted. Five 
convergence assessment methods were examined: the maximum absolute change in model 
parameters, the maximum absolute change in item endorsement probabilities and structural 
parameters, the absolute change in log-likelihood, the relative log-likelihood, and the 
comprehensive method. The data generating models were the saturated CDM and the hierarchical 
CDM. The number of items was set to J — 16 and 32. Three levels of sample sizes were considered: 
500, 1000, and 4000. Three convergence tolerance value conditions were: 107“, 1076, and 10-8. 
The simulated response data were fitted by the saturated CDM using the mCDM and the R package 
GDINA. And the maximum number of iterations was set to 50000. 

Simulation results suggest that: 


(1) The saturated CDM converged under all conditions. However, the actual number of 
30 


iterations exceeded 30000 under some conditions, which implies that when predefined maximum 
iteration number is less than 30000, the MLE-EM algorithm might mistakenly stop. 

(2) The model parameter estimation framework affected the performance of the convergence 
criteria. The performance of the convergence criteria under the m CDM framework was comparable 
or superior to that of the GDINA framework. 

(3) Regarding the convergence tolerance values considered in this study, 10-8 consistently 
had the best performance in providing the maximum value of the log-likelihood and 1074 had the 
worst as suggested by the higher log-likelihood value. Compared to all other convergence 
assessment methods, the comprehensive method in general had the best performance, especially 
under the m CDM framework. The performance of the maximum absolute change in model 
parameters was similar to the comprehensive method, however, its good performance was not 
guaranteed. On the contrary, the relative log-likelihood had the worst performance under the m CDM 
or GDINA framework. 

The simulation results showed that, the most appropriate convergence criterion for MLE-EM 
in CDMs was the comprehensive method with tolerance 1078 under the mCDM framework. 
Results from the real data analysis also demonstrated the good performance of the proposed 


comprehensive method and mCDM framework. 


Key words model parameter estimation, point estimation, convergence criterion, cognitive 


diagnostic model 
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